1. Copyright (C) 2018 DeNA Co.,Ltd. All Rights Reserved.Copyright (C) 2018 DeNA Co.,Ltd. All Rights Reserved.
AI/MLシステムにおけるビッ
グデータとの付き合い方
JAWS DAYS 2019
February 23, 2019
Shota Suzuki
ML Engineering G
DeNA Co., Ltd.
1
2. Copyright (C) 2018 DeNA Co.,Ltd. All Rights Reserved.
自己紹介
鈴木 翔太
株式会社ディー・エヌ・エー システム本部AIシステム部MLエンジニアリングG
MLエンジニア
⁃ AI/MLシステムの本番組み込み
⁃ データの前処理・データパイプライン
⁃ 分析、学習環境の構築
2
3. Copyright (C) 2018 DeNA Co.,Ltd. All Rights Reserved.
Agenda
DeNAでのAI/MLへの取り組みの紹介
⁃ 組織体制
⁃ 交通事故低減に向けたAI技術活用の取り組み
研究開発を進めるためのビッグデータ処理
⁃ データの保管方法
⁃ 本番システムでのデータ処理
⁃ 分析、学習環境
3
4. Copyright (C) 2018 DeNA Co.,Ltd. All Rights Reserved.
DeNA 事業ポートフォリオ
多種多様な領域でのビジネス・サービス展開
パートナー企業と共に社会影響の大きなサービス創出
大規模インターネットサービスプラットフォームの構築
4
ゲーム
エンター
テイメント 新領域スポーツ ヘルスケア
オート
モーティブ
eコマース・
その他
ソーシャル
LIVE
5. Copyright (C) 2018 DeNA Co.,Ltd. All Rights Reserved.
AI 技術の蓄積と活用
5
実用系
実験系
スピード
パートナーシップ案件 自社サービス
基礎技術開発
実用価値提供
実証実験
実用価値提供
サービス内実験
最新論文の実装・実験
研究成果の外部発信
最新研究を自社
サービスデータを
活用して実験
先端技術の適用実績を
スピーディーに蓄積
確度の高い技術を
活用した価値を提供
自社サービスでは
獲得できないデー
タを活用した、
実験的取組みによ
る技術力の向上と、
新しい価値の探求
6. Copyright (C) 2018 DeNA Co.,Ltd. All Rights Reserved.
AI サービス応用を実現するための組織体制
6
CV / NLP / 音声 / 強化学習等の 研究
上の専門技術を保有 日進月歩の先端研
究動向をウォッチし専門技術を活用し
て事業貢献
高い専門性
サービス・事業の抱える分析課題を解
くことに燃えるスペシャリスト集団
手段を問わず最高の精度を出すことに
泥臭くコミット
幅広い引き出し
ML エンジニア
AI技術をサービス上に実装して安定運用を実現する
データの収集、前処理やAPIの提供
高いエンジニアリング能力
AI 研究開発エンジニア データサイエンティスト
7. Copyright (C) 2018 DeNA Co.,Ltd. All Rights Reserved.
7
交通事故低減に向けた
AI 技術活用の取り組み
8. Copyright (C) 2018 DeNA Co.,Ltd. All Rights Reserved.
行動変容に基づく交通事故低減
8
運転行動をモニタリングし潜在的な不安全行動を指摘→行動変容を促す
地図
ドライバー
モニタリング 環境
モニタリング
センサ解析
(GPS、加速度、ジャイロ)
9. Copyright (C) 2018 DeNA Co.,Ltd. All Rights Reserved.
ドライバーモニタリング
9
ランドマーク検出+顔姿勢推定
⁃ 顔のランドマークを検出し、顔の3Dモデルとフィッティングすることで顔の3D姿勢を推定
・・・
左目
鼻
あご
ランドマーク検出結果 顔の3Dモデル
10. Copyright (C) 2018 DeNA Co.,Ltd. All Rights Reserved.
車載カメラ画像認識による環境モニタリング
10
11. Copyright (C) 2018 DeNA Co.,Ltd. All Rights Reserved.
大規模の実走行データでの実証
11
実証実験を通して、大規模に実走行データを収集
アノテーション体制を構築し、AI研究開発に必要十分なラベル付きデータを
いつでも作成・利用できる状態
12. Copyright (C) 2018 DeNA Co.,Ltd. All Rights Reserved.
危険運転行動検出アルゴリズムの開発
12
CVモデルからのデータをはじめ、車速/加速度/地図データから危険運転行
動の特徴を把握し、機械学習等を用いて検出アルゴリズムを開発
危険運転行動の特徴把握
ビジネス要件に合わせた
アルゴリズムの開発
危険運転
行動
安全運転行動
CVモデルなどからデータを取得
13. Copyright (C) 2018 DeNA Co.,Ltd. All Rights Reserved.
独自のアルゴリズムによる危険運転行動検出
13
CV / NLP / 音声 / 強化学習等の 研究
上の専門技術を保有 日進月歩の先端研
究動向をウォッチし専門技術を活用し
て事業貢献
高い専門性
サービス・事業の抱える分析課題を解
くことに燃えるスペシャリスト集団
手段を問わず最高の精度を出すことに
泥臭くコミット
幅広い引き出し
ML エンジニア
AI技術をサービス上に実装して安定運用を実現する
データの収集、前処理やAPIの提供
高いエンジニアリング能力
AI 研究開発エンジニア データサイエンティスト
高精度な車間距離算出モデルの開発 危険運転行動検出アルゴリズムの開発
データ収集、本番環境へのデプロイ、運用
CVチーム(AI研究開発エンジニア)の作成した高品質なモデルを活用して
DSチームが危険運転行動検出アルゴリズムを開発し
ドライバー本人にも納得感のある危険運転行動検出を実現
あおり運転検出の例
14. Copyright (C) 2018 DeNA Co.,Ltd. All Rights Reserved.
14
AI研究開発を進めるため
のビッグデータ処理
15. Copyright (C) 2018 DeNA Co.,Ltd. All Rights Reserved.
基本方針
MLエンジニア側でモデル開発部分以外はなんでもやる
⁃ 学習環境の整備、本番システムへの組み込みなど
⁃ 研究開発エンジニア、データサイエンティストに対してはクラウド利用の敷居を極力下げる
マネージドサービスをなるべく使う
⁃ 運用にかける工数を極力減らし本質的な開発に集中
生のデータをS3、EFSにおき研究開発に利用
⁃ データサイズがかなり大きいのでデータ量と保管場所には注意する
15
16. Copyright (C) 2018 DeNA Co.,Ltd. All Rights Reserved.
システム構成
16
車載器通信用ALB
Car API
ALB
Web API
AWS IoT
社内PC
顧客Tablet/PC
車載器
Job Kicker Server
AWS Batch
AI処理
Map Match
位置情報処理
ALB
SQS
Webサービス用
SageMaker 学習用EC2
AWS Glue
S3
SQS
ELB リバプロ Kibana Elasticsearch Service
CVエンジニア・データサイエンティスト分析
AI・危険運転解析処理
アプリログ分析
DynamoDB AuroraMemcache
Argus(内製BI)
車載器データ処理・Webサービス
CloudWatch CloudTrail Amazon SNS
• AIの分析・解析・試験環境において、多種多様なAWSコンポーネントを活用
IGW
DynamoDB
EFS
23. Copyright (C) 2018 DeNA Co.,Ltd. All Rights Reserved.
システム間連携
23
車載器通信用ALB
Car API
ALB
Web API
車載器
Job Kicker Server
AWS Batch
AI処理
Map Match
位置情報処理
ALB
SQS
Webサービス用
S3
SQS
AI・危険運転解析処理
DynamoDB AuroraMemcache
車載器データ処理・Webサービス
IGW
DynamoDB
自動車のデータの収集とAI系処理はそれぞれ部門を分けて開発
部門間に跨る処理はSQSで住み分け、結果はS3, Auroraで共有
AI側処理に失敗したとしても収集したデータは残るので再処理可能